智能论文笔记

A semi-supervised geometric-driven methodology for supervised fishing activity detection on multi-source AIS tracking messages

Martha Dais Ferreira , Gabriel Spadon , Amilcar Soares , Stan Matwin

分类：机器学习

2022-07-12

自动识别系统（AIS）消息对于使用无线电链路和卫星收发器在全球范围内跨海的血管活动很有用。这样的数据在跟踪血管活性和映射迁移率模式（例如捕鱼中发现）中起着重要作用。因此，本文提出了一种几何驱动的半监督方法，用于从AIS数据中检测捕捞活动。通过提出的方法，我们展示了如何探索消息中包含的信息，以提取描述船舶路线几何形状的特征。为此，我们利用了聚类分析的无监督性质来标记轨迹几何形状，突出了往往表明捕鱼活动的容器运动模式的变化。建议的无监督方法获得的标签用于检测捕鱼活动，我们将其作为时间序列分类任务进行。在这种情况下，我们在AIS数据流上使用复发性神经网络提出了一个解决方案，该解决方案大约是50种不同看不见的渔船的整个轨迹的总$ F $分数的87％。此类结果伴随着广泛的基准研究，该研究评估了不同复发性神经网络（RNN）体系结构的性能。总之，这项工作通过提出一个详尽的过程来做出贡献，其中包括数据准备，标签，数据建模和模型验证。因此，我们提出了一种新颖的解决方案，用于迁移模式检测，该解决方案依赖于时间上展开轨迹并观察其固有的几何形状。

translated by 谷歌翻译

Unfolding AIS transmission behavior for vessel movement modeling on noisy data leveraging machine learning

Gabriel Spadon , Martha D. Ferreira , Amilcar Soares , Stan Matwin

分类：机器学习 | 人工智能

2022-02-24

海洋是令人印象深刻的复杂数据混合的来源，可用于发现尚未发现的关系。此类数据来自海洋及其表面，例如用于跟踪血管轨迹的自动识别系统（AIS）消息。 AIS消息以理想的定期时间间隔通过无线电或卫星传输，但随着时间的流逝而变化不规则。因此，本文旨在通过神经网络对AIS消息传输行为进行建模，以预测即将到来的AIS消息的内容，尤其是在同时方法的情况下，尽管消息的时间不规则性作为异常值。我们提出了一组实验，其中包含用于预测任务的多种算法，其长度不同。深度学习模型（例如，神经网络）表明自己可以充分地保留血管的空间意识，而不管时间不规则。我们展示了如何通过共同努力来改善此类任务的卷积层，进料网络和反复的神经网络。尝试短，中和大型消息序列，我们的模型达到了相对百分比差异的36/37/38％ - 越低，越好，而我们在Elman的RNN上观察到92/45/96％，51 /52/40％的GRU，LSTM的129/98/61％。这些结果支持我们的模型作为驱动器，以改善在时间噪声数据下同时分析多个分歧类型的血管时，可以改善船舶路线的预测。

translated by 谷歌翻译

Survey of Generative Methods for Social Media Analysis

Stan Matwin , Aristides Milios , Paweł Prałat , Amilcar Soares , François Théberge

分类：机器学习

2021-12-13

本次调查绘制了用于分析社交媒体数据的生成方法的研究状态的广泛的全景照片（Sota）。它填补了空白，因为现有的调查文章在其范围内或被约会。我们包括两个重要方面，目前正在挖掘和建模社交媒体的重要性：动态和网络。社会动态对于了解影响影响或疾病的传播，友谊的形成，友谊的形成等，另一方面，可以捕获各种复杂关系，提供额外的洞察力和识别否则将不会被注意的重要模式。

translated by 谷歌翻译

Attributed Question Answering: Evaluation and Modeling for Attributed Large Language Models

Bernd Bohnet , Vinh Q. Tran , Pat Verga , Roee Aharoni , Daniel Andor , Livio Baldini Soares , Jacob Eisenstein , Kuzman Ganchev , Jonathan Herzig , Kai Hui

分类：自然语言处理

2022-12-15

Large language models (LLMs) have shown impressive results across a variety of tasks while requiring little or no direct supervision. Further, there is mounting evidence that LLMs may have potential in information-seeking scenarios. We believe the ability of an LLM to attribute the text that it generates is likely to be crucial for both system developers and users in this setting. We propose and study Attributed QA as a key first step in the development of attributed LLMs. We develop a reproducable evaluation framework for the task, using human annotations as a gold standard and a correlated automatic metric that we show is suitable for development settings. We describe and benchmark a broad set of architectures for the task. Our contributions give some concrete answers to two key questions (How to measure attribution?, and How well do current state-of-the-art methods perform on attribution?), and give some hints as to how to address a third key question (How to build LLMs with attribution?).

translated by 谷歌翻译

Visual Localization and Mapping in Dynamic and Changing Environments

João Carlos Virgolino Soares , Vivian Suzano Medeiros , Gabriel Fischer Abati , Marcelo Becker , Glauco Caurin , Marcelo Gattass , Marco Antonio Meggiolaro

分类：机器人

2022-09-21

完全自主移动机器人的现实部署取决于能够处理动态环境的强大的大满贯（同时本地化和映射）系统，其中对象在机器人的前面移动以及不断变化的环境，在此之后移动或更换对象。机器人已经绘制了现场。本文介绍了更换式SLAM，这是一种在动态和不断变化的环境中强大的视觉猛烈抨击的方法。这是通过使用与长期数据关联算法结合的贝叶斯过滤器来实现的。此外，它采用了一种有效的算法，用于基于对象检测的动态关键点过滤，该对象检测正确识别了不动态的边界框中的特征，从而阻止了可能导致轨道丢失的功能的耗竭。此外，开发了一个新的数据集，其中包含RGB-D数据，专门针对评估对象级别的变化环境，称为PUC-USP数据集。使用移动机器人，RGB-D摄像头和运动捕获系统创建了六个序列。这些序列旨在捕获可能导致跟踪故障或地图损坏的不同情况。据我们所知，更换 - 峰是第一个对动态和不断变化的环境既有坚固耐用的视觉大满贯系统，又不假设给定的相机姿势或已知地图，也能够实时运行。使用基准数据集对所提出的方法进行了评估，并将其与其他最先进的方法进行了比较，证明是高度准确的。

translated by 谷歌翻译

Relict landslide detection in rainforest areas using a combination of k-means clustering algorithm and Deep-Learning semantic segmentation models

Guilherme P. B. Garcia , Carlos H. Grohmann , Lucas P. Soares , Mateus Espadoto

分类：计算机视觉

2022-08-04

滑坡在陡峭的斜坡上具有破坏性和反复发生的自然灾害，并代表了生命和财产的风险。了解遗物滑坡的位置对于了解其机制，更新库存图并改善风险评估至关重要。但是，在覆盖着雨林植被的热带地区，遗物滑坡映射很复杂。提出了一种新的CNN方法，用于半自动检测遗物滑坡，该检测使用由K均值聚类算法生成的数据集并具有预训练步骤。在预训练中计算的权重用于微调CNN训练过程。使用CBERS-4A WPM图像进行了建议和标准方法之间的比较。使用三个用于语义分割的CNN（U-NET，FPN，Linknet）带有两个增强数据集。总共测试了42种CNN组合。在测试的组合之间，精度和回忆的值非常相似。每种组合的召回率都高于75 \％，但是精度值通常小于20 \％。假阳性（FP）样品被称为这些低精度值的原因。提出的方法的预测更准确，正确检测到更多的滑坡。这项工作表明，在被雨林覆盖的区域发现遗物滑坡存在局限性，这主要与牧场的光谱响应与与\ textit {gleichenella sp。}蕨类植物的森林砍伐区域之间的相似性有关，通常用作lands斑scars的指示。

translated by 谷歌翻译

Overwatch: Learning Patterns in Code Edit Sequences

Yuhao Zhang , Yasharth Bajpai , Priyanshu Gupta , Ameya Ketkar , Miltiadis Allamanis , Titus Barik , Sumit Gulwani , Arjun Radhakrishna , Mohammad Raza , Gustavo Soares

分类：人工智能

2022-07-25

集成开发环境（IDE）提供工具支持，以自动化许多源代码编辑任务。传统上，IDE仅使用空间上下文，即开发人员正在编辑的位置来生成候选编辑建议。但是，仅空间上下文通常不足以自信地预测开发人员的下一个编辑，因此IDE在某个位置会产生许多建议。因此，IDE通常不会主动提供建议，而是需要单击特定图标或菜单，然后从大量潜在建议列表中进行选择。结果，开发人员通常会错过使用工具支持的机会，因为他们不知道它存在或忘记使用它。为了更好地理解开发人员行为中的常见模式并产生更好的编辑建议，我们还可以使用时间上下文，即开发人员最近执行的编辑。为了启用基于时间上下文的编辑建议，我们提出了《守望先锋》，这是一种从IDE中执行的开发人员编辑痕迹学习编辑序列模式的新颖技术。我们的实验表明，《守望先锋》具有78％的精度，守望先锋不仅完成了开发人员错过使用IDE工具支持的机会，而且还预测了在IDE中没有工具支持的新编辑。

translated by 谷歌翻译

Machine Learning in Orbit Estimation: a Survey

Francisco Caldas , Cláudia Soares

分类：机器学习

2022-07-19

自50年代后期以来，当发射第一个人造卫星时，居民太空物品（RSO）的数量已稳步增加。据估计，目前约有100万个大于1厘米的物体正在绕地球绕，只有30,000个，大于10厘米，目前正在跟踪。为了避免碰撞的链反应，称为凯斯勒综合征，必须准确跟踪和预测空间碎片和卫星的轨道是必不可少的。当前基于物理的方法在7天的预测中存在误差，在考虑大部分小于1米的空间碎片时，这是不够的。通常，这种故障是由于轨迹开始时空间对象状态周围的不确定性，在环境条件（例如大气阻力）中的预测错误以及RSO的质量或几何形状等特定的未知特征。利用数据驱动的技术，即机器学习，可以提高轨道预测准确性：通过得出未测量的对象的特征，改善非保守力的效果，并通过深度学习模型具有高度复杂的非复杂性非 - 的卓越抽象能力来建模线性系统。在这项调查中，我们概述了该领域正在完成的当前工作。

translated by 谷歌翻译

A Temporal Fusion Transformer for Long-term Explainable Prediction of Emergency Department Overcrowding

Francisco M. Caldas , Cláudia Soares

分类：机器学习

2022-07-01

急诊部门（EDS）是葡萄牙国家卫生服务局的基本要素，可作为具有多样化和非常严重医疗问题的用户的切入点。由于ED的固有特征；预测使用服务的患者数量特别具有挑战性。富裕和医疗专业人员人数之间的不匹配可能会导致提供的服务质量下降，并造成对整个医院产生影响的问题，并从其他部门征用医疗保健工作者以及推迟手术。。 ED人满为患的部分是由非紧急患者驱动的，尽管没有医疗紧急情况，但诉诸于紧急服务，几乎占每日患者总数的一半。本文描述了一种新颖的深度学习体系结构，即时间融合变压器，该结构使用日历和时间序列协变量来预测预测间隔和4周期间的点预测。我们得出的结论是，可以预测葡萄牙健康区域（HRA）（HRA）的平均绝对百分比误差（MAPE）和均方根误差（RMSE）为84.4102人/天的平均绝对百分比误差（MAPE）。本文显示了支持使用静态和时间序列协变量的多元方法的经验证据，同时超越了文献中常见的其他模型。

translated by 谷歌翻译

Large-Margin Representation Learning for Texture Classification

Jonathan de Matos , Luiz Eduardo Soares de Oliveira , Alceu de Souza Britto Junior , Alessandro Lameiras Koerich

分类：计算机视觉 | 机器学习

2022-06-17

本文提出了一种新的方法，该方法结合了卷积层（CLS）和大规模的度量度量，用于在小数据集上进行培训模型以进行纹理分类。这种方法的核心是损失函数，该函数计算了感兴趣的实例和支持向量之间的距离。目的是在迭代中更新CLS的权重，以学习一类之间具有较大利润的表示形式。每次迭代都会产生一个基于这种表示形式的支持向量表示的大细边缘判别模型。拟议方法的优势W.R.T.卷积神经网络（CNN）为两倍。首先，由于参数数量减少，与等效的CNN相比，它允许用少量数据进行表示。其次，自返回传播仅考虑支持向量以来，它的培训成本较低。关于纹理和组织病理学图像数据集的实验结果表明，与等效的CNN相比，所提出的方法以较低的计算成本和更快的收敛性达到了竞争精度。

translated by 谷歌翻译